speedup相关论文
随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个......
Firstly, with the discusses of main ingredients to exert the peak float performance for currently high performance mirc......
针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算......
An optimal algorithmic approach to task scheduling for,triplet based architecture(TriBA),is proposed in this paper.TriBA......
The performance gap between softwareDSM systems and message passing platforms prevents the prevalence ofsoftware DSM sys......
Quasi-real-time simulation of rotating drum using discrete element method with parallel GPU computin
Real-time simulation of industrial equipment is a huge challenge nowadays.The high performance and fine-grained parallel......
为了使得算法对蚁群进化的控制更加直接、算法更加高效,针对加权MAX-SAT的特点,以重离散化方式简化蚁群算法模型,提出取值概率的概......
针对提速后的小唐河大桥,运用动力检测方法,对其梁跨中的动挠度、横向振幅、横向及竖向加速度、振动频率,梁端横向振幅,墩顶横向振幅、......
为了更好地为电池行业服务,创刊于1998年的<电池快讯>月刊在2002年提速了,它扩大了版面,增加了信息量,新出版的<电池快讯>月刊将更......
文中首先介绍了中国气象局武汉暴雨研究所高性能计算机应用现状和目前的模式业务系统,针对气象预报模式精细化对计算能力的更高需求......
可扩展性是并行计算系统的重要性能指标,虽然异构系统越来越普遍,但对其可扩展性的研究还很少。给出了一种既适合同构并行计算系统......
提出了基于软相关的12通道GPS软件接收机实时化的改进方法,主要针对耗时较多的信号检测模块和相关器进行算法优化和程序优化,并给......
在评价多核CPU加速比已知模型的基础上,基于第一性计算原理融合理解阿姆达尔定律和兰特法则,提出描述多核CPU加速比的一个新模型.......
采用SystemC建立了一个基于共享总线的MPSoC仿真平台,设计了3个实验分别用于建模3种典型应用(低计算,通讯比、高计算,通讯比和非独立任......
用传统的串行算法进行矩阵相乘运算会受到矩阵规模、单机的CPU主频、内存大小和存储器空间等方面的限制。而使用并行算法是解决上......
在视频压缩中存在大量可并行的计算如DCT/IDCT、运动估计、运动补偿、量化/反量化等,它们占计算量的主要部分,特别是DCT和运动估计......
针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或......
并行计算是解决复杂大规模工程计算问题的有效方法。现提出了一种基于带控制器并行结构模型的并行微粒群算法,它是一种粗粒度的并......
随着芯片集成度快速提高,带有交叉缓存(crosspoint buffer)的cicq(Combined Input and Crossbar Queued switch)交换机引起了人们的广泛......
以子结构模态综合分析为基础,提出一种求解大型结构特征值问题的并行解法.采用子结构模态综合算法,结构特征模态采用子空间迭代方式并......
为解决大规模地下水流数值模拟参数估值计算时间过长的问题,基于粗粒度任务分解方法,采用消息传递接口(message passing interface,......
针对现代高性能多核处理器的设计周期长、复杂性高、难度大、软件开发相对滞后等一系列问题,文中设计与实现了针对西安邮电大学自......
集中式并行分组交换算法(Centralized Parallel Packet Switch Algorithm,CPA)和分布式并行分组交换算法(Distributed Parallet Pa......
随着图形处理器(GPU)的处理能力的不断增强,图形处理器越来越多的运用在计算密集型的数据处理中。AVS标准视频压缩算法中一些步骤存在......
提出了一种新的基于对角划分的矩阵乘并行算法,它在以往行列划分策略的基础上,采用基于对角划分的策略.数值试验表明该算法具有较......
传统的K-means算法由于随机选择初始聚类中心,使得聚类结果不精确。随着网络数据量的激增,传统的串行算法运算时间明显太长,有研究......
针对典型图像特征提取算法SURF速度偏慢的问题,深入分析该算法在运行时间、指令类型、内存访问、热点等方面的特性。在此基础上,运......
首先研究了并行计算技术,然后对现行仿真系统中的并行算法、模型分配等机制进行分析,提出优化方法和设计评估方法,实现了一种实体运动......
MPP系统的加速特性研究,找出影响MPP系统性能的关键因素,着重研究提高系统性能的主要途径,为设计高性能的MPP系统提供了参考。......
文章通过对运动矢量分布的研究,在全局运动信息提取的基础上,结合准确可靠的运动矢量预测和尽早中止的技术,提出了一种基于全局运......
文章给出厂一个这种模型的并行计算机系统,设计了一个简单的工作算法.并对该算法的性能进行了分析,最终发现影响并行计算的性能的主要......
<正> 1.引言如何分析、评价并行程序的性能是并行计算的一个重要研究问题。RAM模型为串行算法分析提供了理论基础。据此,我们可以......